
通用世界模型问世:不学习就能生成新领域视频,可实时控制
通用世界模型问世:不学习就能生成新领域视频,可实时控制这才是 AI 视频生成的未来?
这才是 AI 视频生成的未来?
仅在 2024 年 3 月一个月,就有三个华人创立的 AI 视频生成创企获得了融资,而且融资额都过了千万美金。
Adobe 全家桶马上就要拥有最先进的生成式 AI 视频创作能力了
随着 Sora 的爆火,人们看到了 AI 视频生成的巨大潜力,对这一领域的关注度也越来越高。
最近,OpenAI 视频生成模型 Sora 的爆火,给基于 Transformer 的扩散模型重新带来了一波热度,比如 Sora 研发负责人之一 William Peebles 与纽约大学助理教授谢赛宁去年提出的 DiT(Diffusion Transformer)。
2024/02/15,农历正月初六,OpenAI 发布了王炸级产品 Sora,可以通过文字描述生成长达 60s 的视频,画面非常流畅,真实度很高。一下子在国内互联网炸开了锅,得到了广泛传播。
在 OpenAI 发布 Sora 之后,很多人惊呼人类已经迈入 AI 视频时代。除了一次次震惊世界的 AI 视频生成能力展示之外,海外网友讨论的最多的话题,还有「未来该如何避免虚假视频充斥着我们的生活」?
AI 视频生成的「ChatGPT时刻」比想象中提前了6个月。Sora 的诞生意味着什么,何以堪称「世界的模拟器」?
本文总结了关于Sora的四点启发,包括视觉数据训练出更强的泛化能力、OpenAI的Scaling Law路线、与AGI的第一次亲密接触以及OpenAI的宣传策略。
AI 视频生成,是最近最热门的领域之一。各个高校实验室、互联网巨头 AI Lab、创业公司纷纷加入了 AI 视频生成的赛道。Pika、Gen-2、Show-1、VideoCrafter、ModelScope、SEINE、LaVie、VideoLDM 等视频生成模型的发布,更是让人眼前一亮。